@施建军:基于词向量的汉语“N的V”结构研究
基于词向量的汉语“N的V”结构研究——兼与日语「NのV」结构比较
1. 引言:核心争议与研究目标
-
核心问题: 现代汉语中“N的V”结构(如“资金的投入”)的性质长期存在争议,主要集中在三个层面:
- V的词性: V位置上的词(如“投入”)究竟是动词还是名词?
- 多数学者认为其具有动词性,但无法简单归为名词。
- “的”的功能: “的”在这里扮演什么角色?
- 传统上视为结构助词,但陆俭明 (2003) 提出“的”是中心词,也存在争议。
- 整体结构: 整个结构是偏正结构(修饰语+中心语)还是主谓结构?
- 偏正结构说: 与布龙菲尔德的向心结构理论(整体功能应与中心语一致)存在矛盾。如果V是中心,整体应呈动词性;但“N的V”整体功能是名词性的。
- 主谓结构说: 早期学者及陆俭明 (2003) 等人支持,认为是一种特殊的主谓结构变体。
- V的词性: V位置上的词(如“投入”)究竟是动词还是名词?
-
研究目标: 本文旨在利用词向量技术和与日语的对比分析,对上述问题提出新的解释。
2. 核心方法与论证:基于词向量的V性质分析
2.1 实验设计与方法
- 核心工具: BERT词向量模型。
- 优势: 能从海量真实文本中学习词汇在不同上下文中的用法和意义,生成高维向量。向量的相似度可以反映词汇在功能和意义上的接近程度。
- 实验思路: 通过比较向量相似度,判断“N的V”中V的性质。
- 第一步: 提取“N的V”结构中V的词向量。
- 例如:从“资金的投入促进了发展”中提取“投入”的向量。
- 第二步: 提取同一个V在作典型谓语动词使用时的词向量。
- 例如:从“他投入了很多精力”中提取“投入”的向量。
- 第三步: 提取结构相似的“N1的N2”中N2(典型名词)的词向量。
- 例如:从“政府的政策促进了发展”中提取“政策”的向量。
- 第一步: 提取“N的V”结构中V的词向量。
- 分析方法: 运用聚类分析 (Clustering Analysis),观察第一步中提取的向量在向量空间中与第二步(动词)和第三步(名词)的哪一个更接近。
- 研究对象: 选取了“投入、发展、支持、重视、提高、了解、完善、结合、建立、推动”等10个高频动词进行分析。
2.2 实验发现 (以“投入”为例)
- 聚类结果:
- “N的V”中的“投入”(来自例句1a)与作谓语的“投入”(来自例句1b)以及其他典型动词(如“花费”、“下”)被清晰地 聚为一类。
- 这一动词类别与典型名词(如“政策”、“实力”)被 分在不同的类别 中,距离较远。
- 可视化呈现: 论文中的 树状图 (Dendrogram) 直观地展示了上述聚类结果,证明了“N的V”中的V和作谓语的V具有高度的功能相似性。
2.3 结论
- V的性质是动词性: 词向量分析提供了强有力的数据证据,表明“N的V”结构中的V在功能上更接近于动词,而非名词。
- 结构性质是特殊主谓结构: 既然V是动词性的,那么“N的V”就不能是简单的偏正结构,而应被视为一种 特殊的主谓结构。
3. 日语启示与“的”的功能新解
3.1 遗留问题
- 如果“N的V”是主谓结构,那么连接N和V的助词“的”究竟起什么作用?
3.2 跨语言比较:日语「NのV」结构
- 相似结构: 日语中存在与汉语“N的V”高度对应的「NのV」结构(体言の用言)。
- 关键证据: 日语拥有丰富的格助词系统。在许多情况下,「NのV」中的「の」可以被明确的 格助词 替换,而不改变基本意思。
- 主格替换: 母の作ったお菓子 (妈妈做的点心) ⇔ 母が作ったお菓子 (妈妈做的点心),「の」在此处功能等同于主格助词「が」。
- 宾格替换: お茶の飲みたい方 (想喝茶的人) ⇔ お茶を飲みたい方 (想喝茶的人),「の」在此处功能等同于宾格助词「を」。
- 日语的启示: 日语的形态变化明确显示出,「の」在这一结构中扮演的是 标记名词格位 的角色。
3.3 汉语“的”的功能推论
- 核心推论: 类比日语,汉语“N的V”结构中的“的”也应被视为一种 特殊格标记 (Special Case Marker)。
- 功能: 它标示了名词N与动词V之间的语义关系(如施事、受事、主语、宾语等)。
- 解释: 由于汉语是分析语,缺乏形态变化,所以“的”的格标记功能是内隐的、不明显的,不像日语那样可以被直接替换验证,但这解释了其在此结构中的特殊地位。
3.4 解释情态成分的限制
- 现象: “N的V”结构通常不能包含情态动词或体貌助词(如“人民能的解放”不成立)。
- 理论解释:
- 一个完整的句子由两个层次构成:命题 (Proposition) + 情态 (Modality)。
- 命题: 指客观事件本身。
- 情态: 指说话者对事件的主观态度、判断或看法(如可能性、必要性等)。
- “N的V”的定位: 该结构仅用于指称一个事件,即它只实现了句子的命题功能,是名词化的事件短语。
- 逻辑推演: 一旦加入情态成分(如“能”、“会”),这个结构就不再仅仅是一个事件的名称,而变成了一个完整的判断,即一个完整的句子/子句。一个完整的句子不能再充当另一个句子中的名词性成分(如主语或宾语),这与“N的V”结构的实际用法相悖。
- 一个完整的句子由两个层次构成:命题 (Proposition) + 情态 (Modality)。
4. 总结
- V的性质: 基于词向量的证据,“N的V”中的V具有 动词性。
- “的”的功能: 通过与日语对比,“的”的功能可被解释为一种 特殊格标记。
- 整体结构: “N的V”不是偏正结构,而是一种具有指称功能的 特殊主谓结构 或 格结构。